iT邦幫忙

2024 iThome 鐵人賽

DAY 4
0
生成式 AI

從零開始學-生成式AI系列 第 4

Day4---機器學習與深度學習基礎

  • 分享至 

  • xImage
  •  

1. 機器學習 (ML) 概述

機器學習是一種讓電腦能夠自動從數據中學習規則,並進行預測或決策的技術。它的三種主要類型是:

  • 監督式學習 (Supervised Learning): 使用帶標籤的數據進行訓練。模型根據輸入數據和已知的輸出標籤來學習,例如圖片分類或文本情感分析。
  • 非監督式學習 (Unsupervised Learning):採用自我學習演算法,不需要加上標籤或事先訓練,使用未加上標籤的原始資料,並根據相似性、差異性和模式來推論出自己的規則。
    非監督式學習演算法更適合用於較為複雜的處理工作,例如將大型資料集整理成叢集。這有助於識別先前未偵測到的資料模式,可幫助找出能將資料分類的特徵。
  • 強化學習 (Reinforcement Learning): 通過獎賞(reward)或懲罰用不斷試錯的方式來引導模型學習,常用於遊戲或機器控制中,自動駕駛的一些功能和訓練AI操控街機遊戲就是其中的一些例子,。

在生成式AI中,機器學習模型被用來生成新內容,如文本或圖像。這需要模型在訓練數據中學習模式,並基於這些模式生成新的數據。

2. 深度學習 (DL) 概述

深度學習是機器學習的一個分支,利用深層神經網絡進行複雜的模式識別和數據生成。生成式AI依賴於深度學習的模型來自動生成數據,常見的架構包括:

  • 人工神經網絡 (Artificial Neural Networks, ANN): 模仿人腦神經元運作的基本結構,由多層神經元構成,每一層神經元進行數據的傳遞與轉換。
  • 卷積神經網絡 (Convolutional Neural Networks, CNNs): 用於處理圖像數據,CNN能識別圖像中的重要特徵,應用於圖像生成和辨識中。
  • 遞歸神經網絡 (Recurrent Neural Networks, RNNs): 適合處理序列數據,例如文本。生成式AI中的文本生成模型,如GPT,就使用了改進的RNN結構。
  • 長短期記憶 (LSTM): 一種特定的RNN變體,解決了RNN在長序列數據中遇到的“長期依賴”問題,適合語言生成。

3. 生成式AI中的應用

在生成式AI中,特定的深度學習模型用於生成內容,以下是主要應用技術:

  • 生成對抗網絡 (GANs): 用於生成圖像的模型,由生成器和判別器組成。生成器負責創建偽造數據,而判別器則試圖辨識真實數據與偽造數據。
  • 變分自編碼器 (Variational Autoencoders, VAEs): 另一種用於生成圖像和文本的模型,通過壓縮和解壓縮數據來生成新內容。
  • Transformer模型: 用於生成文本的模型,特別是如GPT這樣的預訓練變換器模型,能根據上下文生成自然且流暢的文本。
參考資料:

1
2
3
(這些參考資料能幫助我簡單的理解,另外還有很多網路上的影片講解了關於今天的學習內容,多樣的模型在短時間內很難令人理解,很佩服這些影片創作者,甚至是樂於分享的教授,我今天受益良多,感謝他們的付出。)

明日預告實踐活動

  • 使用Hugging Face進行文本生成:
    步驟
    1. 註冊並訪問 Hugging Face
    2. 使用現成的模型如GPT-2來生成簡單的文本。
    3. 嘗試學習甚至調整模型內容,來產生自己所想要的文本

上一篇
Day3—生成式AI的概念以及歷史
下一篇
Day5---使用 Hugging Face 進行文本生成
系列文
從零開始學-生成式AI7
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言